Propagation de pertinence et exploitation du texte ancre des liens et de la balise titre pour améliorer la recherche dans les documents XML (C)

نویسنده

  • Samia Berchiche-Fellag
چکیده

RÉSUMÉ. L’exploitation des liens dans les documents XML, ne permet pas uniquement la restitution des éléments pertinents répondants à une requête utilisateur, inaccessibles par une recherche classique, mais aussi, le réordonnancement des éléments déjà retrouvés lors de cette recherche. Dans ce papier, nous proposons non seulement de propager le score de pertinence des documents restitués par une première recherche, vers ses voisins, mais aussi, d’exploiter le texte ancre des liens, ainsi que le contenu de la balise titre des documents, pour retrouver les éléments pertinents, en attribuant un score à chacune de ces représentations. ABSTRACT. Using the relations expressed in XML documents, does not only permit to return relevant answers elements to a user query unavailable by traditional search, but also the reordering of the elements already found in this research. In this paper, we propose not only to propagate the relevance score of returned documents by a first search to its neighbors, but also, to exploit the anchor text links, and content of the title tag to retrieve relevant elements by assigning a score to each of these representations.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

Expérimentations sur un modèle de recherche d'information utilisant les liens hypertextes des pages Web

Résumé. La fonction de correspondance, qui permet de sélectionner et de classer les documents par rapport à une requête est un composant essentiel dans tout système de recherche d'information. Nous proposons de modéliser une fonction de correspondance prenant en compte à la fois le contenu et les liens hypertextes des pages Web. Nous avons expérimenté notre système sur la collection de test TRE...

متن کامل

Utilisation de concepts visuels et de la diversité visuelle pour améliorer la recherche d'images

RÉSUMÉ. Dans cet article, nous étudions (i) comment extraire et exploiter des concepts visuels pour améliorer la recherche d’images basée sur le texte, et (ii) comment diversifier les résultats pertinents obtenus. Nous utilisons d’abord des forêts d’arbre de décisions flous (FFDTs) pour détecter les concepts dans les images, puis nous découvrons à l’aide de l’analyse des cooccurrences des relat...

متن کامل

Exploitation des Liens Sémantiques pour l'Expansion de Requêtes dans un Système de Recherche d'Information

RÉSUMÉ: Dans cet article, nous proposons d’exploiter des liens sémantiques entre concepts pour améliorer la recherche d’information. Un thesaurus électronique de langue générale est utilisé pour la reformulation des requêtes utilisateurs en procédant par un processus d’"expansion prudente" en amont d’un moteur de recherche. Ce processus, transparent à l’utilisateur, exploite d’abord la notion d...

متن کامل

DocCat: un composant logiciel de catégorisation de documents et de marquage sémantique XML

Résumé : Cet article présente DocCat un composant logiciel de catégorisation de documents. Cet outil permet de générer des balises sémantiques et de les stocker dans une base de données au format XML. DocCat intègre une méthode d’apprentissage supervisée pour classer des documents texte dans des catégories prédéfinies. Les catégories ainsi induites permettent le balisage du document. L’intérêt ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012